Сайт Информационных Технологий

Некоторые аспекты автоматизированного извлечения и обработки знаний с НЕ-факторами

Г. В. Рыбина, Р. В. Душкин

Московский государственный инженерно-физический институт
(Технический университет)

Abstract — The paper is dedicated to a discussion of automated knowledge bases design problem for integrated expert systems, where the questions of acquisition, representation and processing of fuzzy knowledge are considered. The specific approach to a solution of this problem is proposed, which is realized within the task-oriented methodology of integrated expert systems design with support of AT-TECHNOLOGY complex tools.

Введение. В области приобретения знаний к настоящему времени разработано значительное число подходов, стратегий, методов и процедур работы с экспертами, предложены различные способы обработки полученных результатов, а также создан целый ряд программных средств, автоматизирующих процессы извлечения знаний из экспертов, специальных текстов и баз данных.

Однако, как показывает анализ отечественных и зарубежных работ по проблемам приобретения знаний, практически малоисследованными остаются вопросы приобретения знаний при формировании непротиворечивых баз знаний (БЗ) с так называемыми НЕ-факторами [1]. Эти вопросы имеют важное значение, поскольку знания, извлеченные из экспертов, как правило, содержат различные виды НЕ-факторов, в связи с чем соответствующие методы и процедуры приобретения знаний должны обеспечивать возможность извлечения и обработки не полностью известной информации. В целом решением проблем, связанных с представлением и обработкой каждого из НЕ-факторов, занимаются самостоятельные направления исследований, где для этих целей создаются специальные математические аппараты и формализмы, наиболее известными из которых являются аппарат нечетких множеств [2] и методы недоопределенных моделей [3], на основе которых существует целый ряд конкретных подходов, в частности, описанные в работах [4, 5] и других. Тем не менее, вопросы применения теоретических результатов исследований в этой области к процессам автоматизированного приобретения знаний обсуждаются мало.

Цель данной работы — показать возможные подходы к выявлению и обработке высказываний эксперта о свойствах проблемной области (ПО), содержащих элементы нечеткости, разработанные в рамках задачно-ориентированной методологии построения интегрированных экспертных систем (ИЭС) [6, 7]. Компьютерная поддержка этой методологии на всех стадиях жизненного цикла создания ИЭС осуществляется с помощью инструментального комплекса АТ-ТЕХНОЛОГИЯ [8], в состав которого включены средства автоматизированного приобретения знаний. Опыт использования комплекса АТ-ТЕХНОЛОГИЯ для разработки нескольких прикладных ИЭС, в том числе для экспресс-диагностики крови, диагностики сложной технической системы, проектирования оригинальных объектов машиностроения, комплексных экологических исследований и др., помог накопить значительный материал, связанный с построением БЗ различной сложности для трех типовых задач — диагностики, проектирования и планирования.

Ниже приводится описание предложенных и программно реализованных в комплексе АТ-ТЕХНОЛОГИЯ методов и процедур извлечения, представления и обработки нечетких знаний.

1. Постановка задачи. Проведенные теоретические исследования и анализ экспериментального материала, полученного в результате разработки нескольких прототипов ИЭС, показали, что наиболее распространенными НЕ-факторами, проявление которых было отмечено в знаниях, полученных от экспертов, являются: нечеткость, неопределенность, неточность, недоопределенность и неполнота. Однако в настоящее время более или менее универсальное определение существует только для одного из отмеченных НЕ-факторов — нечеткости [2], для остальных НЕ-факторов у исследователей не выработано единого взгляда на их природу и способы проявления в экспертных знаниях.

В связи с этим рассмотрим возможный подход к формализации выделенного НЕ-факторанечеткости для последующего его выявления в рассуждениях эксперта, представления и обработки.

Нечеткость возникает в случае, когда эксперт пытается количественно охарактеризовать качественные понятия и отношения, которые он использует в своих рассуждениях. Используя теоретико-множественный подход (т.е. в терминах
xI F”) нечеткость означает то, что F является нечетким множеством, т.е. об элементе x невозможно однозначно сказать, принадлежит он множеству F или нет.

Приобретение нечетких знаний является чрезвычайно сложной задачей, поскольку эксперты, как правило, не в состоянии определять и строить функцию принадлежности (ФП) множества F, которая отображает элементы множества F в интервал [0; 1]. Кроме того, эксперт часто не может (не хочет) оперировать четкими понятиями, а использует для решения задачи нечеткие переменные, которые он подсознательно понимает, но выразить количественно затрудняется. Например, в своих рассуждениях эксперт может оперировать понятием “большой”, однако никоим образом не характеризуя это понятие количественно.

Поэтому в рамках задачно-ориентированной методологии проблема приобретения нечетких знаний решается при помощи введения некоторых эвристик. Поскольку основная цель заключается в том, чтобы получить от эксперта ФП используемых понятий, не заставляя его определять их в явном виде, то в данной работе предполагается, что ФП могут быть только трех основных типов, показанных на рис. 1, отражающих наиболее часто встречающиеся формы ФП понятий ПО.

Очевидно, что с достаточной точностью такие ФП могут быть построены по нескольким точкам. Так, например, ФП для понятия “большой” (этому понятию соответствует ФП типа 3) с хорошим приближением может быть определена, если известна точка, в которой ФП принимает значение 0 и точка, где она принимает значение 1.

Таким образом, после извлечения из эксперта контрольных точек ФП используемых им понятий, в БЗ формируются полные описания этих ФП, которые затем используются в процессе нечеткого вывода при решении задач. Любое значение ФП в области определения используемого понятия может быть найдено при помощи линейной интерполяции функции, построенной по контрольным точкам.

2. Обработка нечеткости. Теперь уделим внимание подходам к обработке знаний с нечеткостью, для которых в настоящее время созданы различные методы. В текущей версии инструментального комплекса АТ-ТЕХНОЛОГИЯ реализован специальный нечеткий решатель, который позволяет обрабатывать нечеткие знания. Поскольку нечеткий решатель реализуется в составе комплекса АТ-ТЕХНОЛОГИЯ, то он должен удовлетворять определенным требованиям совместного функционирования с другими компонентами, поддерживающими этапы жизненного цикла построения ИЭС, в связи с чем нельзя было в полной мере воспользоваться опытом конкретных разработок в области нечетких экспертных систем, в том числе и аппаратными реализациями нечеткой машины вывода, т.к. применение микросхемы ограничивает области использования АТ-ТЕХНОЛОГИИ.

Приведем краткую характеристику предложенных подходов к реализации нечеткого решателя. В отличие от обычного вывода, использующего двузначную логику, в частности правила modus ponens (МР) и modus tollens (MT), в нечетком выводе используются модифицированные правила МР и MT:

Если x есть A, то y есть B

x есть A’ (2.1)

y есть B’

Если x есть A, то y есть B

y есть B’ (2.2)

x есть A’

Где A, A’, B, B’ — есть некоторые нечеткие множества, а x и y — нечеткие параметры, участвующие в правиле.

Сам вывод производится по максиминной технологии, осуществляющей сопоставление входных нечетких фактов с фактами из БЗ и производящей вывод заключения методом центра тяжести. Следует отметить, что кроме максиминной технологии нечеткого вывода существуют и другие [2], однако, из-за своей простоты и хорошего приближения к человеческим

рассуждениям, в данной работе используются именно максиминная технология и метод центра тяжести.

Общая архитектура нечеткого решателя, встроенного в инструментальный комплекс АТ-ТЕХНОЛОГИЯ, показана на рис. 2. Нечеткий решатель получает от внешнего управляющего модуля специальные управляющие воздействия, на которые он реагирует соответствующим образом, получая знания из БЗ.

Процесс нечеткого вывода можно описать следующим образом: на вход нечеткого решателя подается нечеткий факт, т.е. отношение типа “x есть A”, где A — некоторое нечеткое множество. Также входным параметром является коэффициент уверенности k, определяющий истинность упомянутого выше факта. Нечеткий решатель сопоставляет входной факт с фактами из левых частей правил, находящихся в БЗ. При удачном сопоставлении формируется конфликтное множество правил, из которого затем выбирается правило с максимальным коэффициентом уверенности, т.е. с максимальным значением максимума ФП. Если таких правил несколько, то выбирается любое из них. Затем выбранное правило и входной факт с коэффициентом k передаются на вход процедуре, которая известна как шаг нечеткого вывода (рис. 3).

Процедура шага нечеткого вывода преобразует входную ФП таким образом, что при k=100% ФП не меняется, а при k=0% ФП превращается в линию уровня 0.5 (полная неопределенность). Далее находится минимум от преобразованной ФП и ФП в антецеденте выбранного правила, после чего находится максимальное значение пересечения. Затем по этому максимальному значению усекается ФП консеквента, которая затем дефаззифицируется. Если процесс нечеткого вывода необходимо продолжать, то вновь полученная ФП не дефаззифицируется, а заносится в рабочую память нечеткого решателя как новый входной факт, при этом значением его коэффициента уверенности берется 100%. Таким образом, процесс нечеткого вывода продолжается, пока не будет достигнут критерий останова.

Заключение. Предложенный подход к извлечению, представлению и обработке знаний, содержащих нечеткость, существенно повышает эффективность задачно-ориентированной методологии автоматизированного построения ИЭС. Все описанные модели, методы и процедуры программно реализованы и в составе средств комплекса АТ-ТЕХНОЛОГИЯ проходят этапы экспериментальной апробации, доработки и модификации.

Выполнение данной работы поддерживалось РФФИ РАН (грант № 98-01-00918).

Литература

  1. Нариньяни А.С. Недоопределенность в системах представления и обработки знаний//Изв. АН СССР. Техн. кибернетика. 1986. №5.
  2. Нечеткие множества в моделях управления и искусственного интеллекта//Под ред. Поспелова Д.А. М.: Наука, 1986.
  3. Проблемы представления и обработки не полностью определенных знаний//Под ред. Нариньяни А.С. М.: РосНИИ ИИ, 1996.
  4. Шапот М.Д. Вывод решений в условиях неопределенности в системе ЭКО//Экспертные системы на персональных компьютерах. Материалы семинара. М.: МДНТП, 1989
  5. Городецкий В.И., Тулупьев А.Л. Формирование непротиворечивых баз знаний с неопределенностью//Изв. Академии Наук. Теория и системы управления. 1997. №5.
  6. Рыбина Г.В. Задачно-ориентированная методология автоматизированного построения интегрированных экспертных систем для статических проблемных областей//Известия РАН. Теория и системы управления. 1997. №5.
  7. Рыбина Г.В. Автоматизированное построение баз знаний для интегрированных экспертных систем. Известия РАН. Теория и системы управления. 1998, №5.
  8. Рыбина Г.В., Пышагин С.В., Смирнов В.В. и др. Программные средства и технология автоматизированного построения интегрированных экспертных систем//Программные продукты и системы. Software & Systems. 1997. №4.

Site of Information Technologies
Designed by  inftech@webservis.ru.